将一个排序的过程拆成了多个阶段来选择 topk 个候选,带来的问题是每个阶段的排序优化目标可能会有割裂

[[@推荐系统技术演进趋势:从召回到排序再到重排]] 召回应该去适配精排 #card

  • 如果在召回阶段使用模型召回,理论上也应该同步采用和排序模型相同的优化目标,尤其是如果排序阶段采用多目标优化的情况下,召回模型也应该对应采取相同的多目标优化。同理,如果整个流程中包含粗排模块,粗排也应该采用和精排相同的多目标优化,几个环节优化目标应保持一致。因为召回和粗排是精排的前置环节,否则,如果优化目标不一致,很可能会出现高质量精排目标,在前置环节就被过滤掉的可能,影响整体效果

[[@Embedding-based Retrieval in Facebook Search]] 精排适配新的召回 #card

  • since the current ranking stages are designed for existing retrieval scenarios, this could result in new results returned from embedding based retrieval to be ranked sub-optimally by the existing rankers

  • 新的 ANN 召回的结果可能并不会被精排认可

将一个排序的过程拆成了多个阶段来选择 topk 个候选,带来的问题是每个阶段的排序优化目标可能会有割裂

https://blog.xiang578.com/post/logseq/将一个排序的过程拆成了多个阶段来选择 topk 个候选,带来的问题是每个阶段的排序优化目标可能会有割裂.html

作者

Ryen Xiang

发布于

2025-04-19

更新于

2025-04-19

许可协议


网络回响

评论